Главная arrow книги arrow Копия Глава 12. arrow Условное планирование в частично наблюдаемых вариантах среды
Условное планирование в частично наблюдаемых вариантах среды

Обратите внимание на то, что предусловия и условия when представляют собой простые высказывания, а не высказывания с оценкой знаний. Так и должно быть, поскольку результаты действий зависят от фактического состояния мира, но как мы могли бы проверить истинность этих условий, если все, что мы знаем, представляет собой доверительное состояние? Если агент знает истинность высказывания, например, K(AtR) в текущем доверительном состоянии, то это высказывание должно быть истинным в текущем физическом состоянии и, безусловно, соответствующее действие является применимым. Если же агент не знает истинность какого-то высказывания (например, условия CleanL конструкции when), то данное доверительное состояние должно включать миры, в которых терм CleanL является истинным, и миры, в которых CI eanL является ложным. Именно поэтому в результате данного действия возникает множество доверительных состояний. Таким образом, если начальным состоянием является, то после движения Left двумя результирующими доверительными состояниями становятся и. В обоих случаях истинностное значение терма CleanL известно, поэтому в плане может использоваться проверка терма CleanL.

При использовании активных средств сбора информации с помощью датчиков (в отличие от автоматических средств сбора информации с помощью датчиков) агент получает новые данные восприятия только после выдачи запроса на их получение. Таким образом, после перемещения с помощью действия Left агент не знает, является ли левый квадрат грязным, поэтому два последних условных результата больше не появляются в описании действия в уравнении 12.2. Чтобы узнать, есть ли в квадрате мусор, агент может выполнить действие CheckDirt следующим образом:

(12.3)